Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
池田 浩; 菊澤 信宏; 吉位 明伸*; 加藤 裕子
Proceedings of 13th Annual Meeting of Particle Accelerator Society of Japan (インターネット), p.637 - 640, 2016/11
J-PARCのLINAC, RCSから得られる制御に必要な大量なデータは、現在PostgreSQLに格納しているが、これをHBaseに格納する計画を進めている。HBaseはいわゆるNoSQLと呼ばれるデータストアで、大量のデータをスケーラブルに扱うことが可能である。HBaseはHadoop上で構築され、両者ともZooKeeperを利用した冗長性の管理が行われている。本格的な運用に先立って、我々のクラスタのHBase/Hadoopのバージョンアップを再度行った。これは、旧バージョンが既にサポート外であること、HBaseのAPIに関する後方互換性の明示的表明、運用開始後はバージョンアップが困難になることが理由として挙げられる。これに伴い、キックスタートや監視スクリプトの修正、これまで作成したツールのアップデートを行った。一方、HBase/Hadoopはデータを堅固に保護するが、そもそもデータを格納できなければこの堅固性は意味を失う。このため、HBase等と同様にZooKeeperを用いてデータ収集ツールを冗長化し、複数ノードに配備することで障害発生時に自動的に対応できるようにした。本発表では、バージョンアップの対応の内容、及び、データ収集ツールの冗長化とその過程で判明した問題について報告する。
池田 浩; 菊澤 信宏; 吉位 明伸*; 加藤 裕子
Proceedings of 12th Annual Meeting of Particle Accelerator Society of Japan (インターネット), p.1312 - 1316, 2015/09
J-PARCのLINAC, RCSから得られる制御に必要な大量なデータは、現在PostgreSQLに格納しているが、これをHBaseに格納する計画を進めている。HBaseはいわゆるNoSQLと呼ばれるデータストアで、大量のデータをスケーラブルに扱うことが可能である。HBaseはHadoopの分散ファイルシステム上で構築され、複数のマシンで構成するクラスタを使用し、障害時の自動復旧や容量増設の容易性が利点として挙げられる。前回の発表では、Hadoopのバージョンアップによって単一障害点であったマスタノードを冗長化し、この新しいバージョンに対する我々のツールの対応と課題について述べたが、同時に、クラスタの構成そのものに対しても幾つかの問題点も述べた。今回の発表では、この問題への対応を含みクラスタの再構築で行ったことについて述べる。具体的には、マスタノード用ハードウェアの強化やノード構築の自動化スクリプトの作成、ノードのモニタリングの導入が挙げられる。また、新規ハードウェアや構成の変更から必要に応じてHadoop/HBaseの設定を調整し、システムのパフォーマンスの測定を行い、その結果と検討を報告する。
菊澤 信宏; 池田 浩; 吉位 明伸*; 加藤 裕子; 大内 伸夫
Proceedings of 11th Annual Meeting of Particle Accelerator Society of Japan (インターネット), p.794 - 798, 2014/10
J-PARCのLINAC, RCSから得られる制御に必要な大量なデータは現在PostgreSQLに格納しているが、データ量が日々増え続ける運転データベースの容量は10TBを超え、2020年には30TBから100TBに増えると予想されており、これらを安定的に管理する問題に直面している。これを解決するため、HadoopおよびHBaseを利用したデータアーカイビングシステムの開発を進めている。HBaseはHadoopの分散ファイルシステム上で構築され、複数のマシンで構成するクラスタを使用し、障害時の自動復旧や容量増設の容易性が利点として挙げられる。また、検索時間は旧システムと比較して最大で1/5程度まで短縮化された。現在までに基本的なシステムの構築を終え、過去データの移行および長期運用を始めている。本件は、これらのデータベースシステム用ツールの作成上の問題点、および、新しいHBase/Hadoopのバージョンへの対応に関する問題点と、その検討・解決方法について報告するものである。
山口 晶大*; 岩舘 満雄*; 鈴木 栄一郎*; 由良 敬; 川北 重恒*; 梅山 秀明*; 郷 通子*
Nucleic Acids Research, 31(1), p.463 - 468, 2003/01
被引用回数:15 パーセンタイル:25.19(Biochemistry & Molecular Biology)拡大FAMSBASEは全ゲノムが判明している41生物種がもつすべてのタンパク質のホモロジーモデリング結果を格納したリレーショナルデータベースである。モデルはFAMSによって構築した。拡大FAMSBASEには各種の検索方法が備わっている; タンパク質名,キーワード,タンパク質と相互作用する低分子名,アミノ酸配列の一致度など。これらのモデルはタンパク質と他の分子との相互作用を研究するよい出発点となる。ドラッグデザインのもととしても利用可能である。現在本データベースには18万以上のタンパク質立体構造が格納されている。本データベースはhttp://famsbase.bio.nagoya-u.ac.jp/famsbase/から利用可能である。
望月 弘樹*; 須山 賢也; 野村 靖; 奥野 浩
JAERI-Data/Code 2001-020, 394 Pages, 2001/08
「SFCOMPO on WWW Ver.2」は1997年に公開された使用済燃料核種組成データベースシステム「SFCOMPO on WWW」の改良版である。「SFCOMPO on WWW Ver.2」はリレーショナルデータベースソフトPostgreSQLの導入により、データベースの管理が可能となっており、さらに多様な検索方法を利用することができる。また、核種組成の解析に必要なすべてのデータをこのシステムのウェブサイトから入手することができる。本報告では、SFCOMPO on WWW Ver.2のシステム概要、インターネットを利用した検索方法について記す。また、登録されている軽水炉14基(PWR7基,BWR7基)の組成データ,炉心概要について記す。